智能论文笔记

DDKtor: Automatic Diadochokinetic Speech Analysis

Yael Segal , Kasia Hitczenko , Matthew Goldrick , Adam Buchwald , Angela Roberts , Joseph Keshet

分类：机器学习

2022-06-29

参与者反复产生音节的Diadochokinetic语音任务（DDK）通常用作评估语音运动障碍的一部分。这些研究依赖于时间密集型，主观的手动分析，并且仅提供粗略的语音图片。本文介绍了两个深度神经网络模型，这些模型会自动从未注释，未转录的语音中分割辅音和元音。两种模型都在原始波形上工作，并使用卷积层进行特征提取。第一个模型基于LSTM分类器，然后是完全连接的层，而第二个模型则添加了更多的卷积层，然后是完全连接的层。这些模型预测的这些分割用于获得语音速率和声音持续时间的度量。年轻健康个体数据集的结果表明，我们的LSTM模型的表现优于当前的最新系统，并且与受过训练的人类注释相当。此外，在对帕金森氏病数据集的看不见的老年人进行评估时，LSTM模型还与受过训练的人类注释者相当。

translated by 谷歌翻译

由于生产和依赖数据集以产生自动化决策系统（广告）增加，因此需要评估和询问底层数据的过程。在2018年启动数据集营养标签后，数据营养项目已对标签的设计和目的进行了重大更新，并在2020年代后期推出更新的标签，该标签在本文中预览。新标签包括通过针对数据科学家配置文件的更新的设计和用户界面提供的上下文专用用例和警报。本文讨论了标签旨在减轻的潜在培训数据的危害和偏见，包括标记，新的和现有挑战以及工作的进一步方向，以及预览新的新数据集标签。

translated by 谷歌翻译